《黑客帝国》中的一句台词或许是个不错的回答:“如果真实是指你能感觉、能闻到、能尝到、能看到的东西,那么,真实不过是你大脑产生的电信号罢了。”(If you're talking about what you can feel, what you can smell, what you can taste and see, then 'real' is simply electrical signals interpreted by your brain.)人类对于外部世界的认知,来自于感官系统(视觉、听觉、嗅觉、味觉和触觉)和大脑对于神经信号的处理。现如今,AR或VR正是在虚拟与现实之间做文章。连续创业者赵维奇的AR启蒙,可以追溯到AR的“鼻祖产品”——Google Glass(谷歌眼镜)。曾经在2012年,谷歌在Google I/O大会上播放了这样一段画面:几名翼装飞行运动员准备跳伞,当机舱门打开,运动员依次跃入旧金山4000英尺的高空,降落在一座建筑附近,画面视角显示他们骑上自行车、穿过一个走廊、推开一扇门,最终来到了Google I/O的会议室现场——而这,一整段在当时看起来甚至有点抖动的画面,都是由运动员佩戴的Google Glass拍摄直播。随后在2014年,第一代Google Glass(当时还叫Google Project Glass)问世。尽管当时的谷歌眼镜过于超前,但依然挑动了赵维奇跃跃欲试的神经,他于2015年火速创业,专注于做极限运动的AR产品。他说:“AR是一个非常有趣的行业,因为它视觉上会带来不一样的感受,同时更是人机交互的巨大变革,因为AR把空间计算利用起来了,原先人类只是依赖于物理环境中的媒介,而AR打开了一个新世界,去给更多媒介做创作和生产,这也是我坚定不移地投身于AR的原因。”曾经有一段时间,业界试着将包括VR、AR、MR在内的所有沉浸式技术归类为同一个名字——“扩展现实”(Extended Reality,XR),但是对于赵维奇这样的从业者而言,AR(Augmented Reality,增强现实)与VR(Virtual Reality,虚拟现实)之间存在巨大差异。其中的一个差异就来自于“虚拟与现实之间的界限”,赵维奇认为,VR是个完全沉浸式设备,没有完全绑定物理空间,这会让用户的体验脱离周遭世界,缺乏安全感。而AR的不同之处在于,它与现实有强关联,不管是商业化、技术上都有很大想象力,因此能预判到人类期待这样的交互方式。此前,作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。Rokid全球开发者生态负责人兼高级产品技术总监赵维奇,摄于Rokid第一代产品发布日“我自己的理念是,Make something people want,想做一些能力解决的工具,或者给大家提供一种新体验的方式,这也是我与Rokid这家公司比较契合的点。”他说。
科技行者:你从毕业之后就致力于创业,为什么会有这个想法?赵维奇:我内心就是有创业的基因在,我在美国待了快十年,一直在硅谷,长期熏陶。然后我自己的理念是,想做一些能力解决的工具,或者给大家提供一种新体验的方式。再加上我是技术出身,所以更容易马上着手拿到东西进行测试,所以我在Rokid也是负责创新多一些。赵维奇:当时在做极限运动的AR,包括滑雪、跳伞、潜水,可以在极限运动中解放双手。赵维奇:极限运动的刚需是比较强,但是也比较垂直,所以它的体量和可扩展性弱一些,市场比较小。我们早期也做了很多商业化动作,在海内外都有发售,销量也还不错,但后来我自己增长了很多硬件和市场相关联的知识,就会发现,它的市场还是比较窄。这没有对错之分,只是选择性的问题。科技行者:你第一次接触AR,大概是2015年左右,还记得当时的情景吗?赵维奇:当时Google Glass(谷歌眼镜)刚出来,是比较惊艳的。那时候物联网(IoT)也是刚起步,智能家居有控制面板,但是你每次要跑去控制面板的位置去看。如果是可穿戴设备,你就随时可以看,这给大家提供了一个想象空间,随时可看、随处可看、所见即所得。而且它的形态是眼镜,尽管当时可穿戴产品蛮多,手表、手环等,但没人想过要做显示设备,光学对于普通创业者有点壁垒,不容易深入了解和实施落地。所以当光学方案的捷径打开、可穿戴的壁垒慢慢消除,你发现它不仅可以显示信息,还可以做交互,就像科幻电影里一个全息可以远程对话的成像,直接呈现数字化内容。这条路线在那个时间段,根据我的背景和Know-How,觉得是有前景的。科技行者:说起AR,就让人想起VR,怎么理解其中的不同? 赵维奇:AR的定义是“增强现实”,顾名思义是“增益”,作用是在你看到的现实世界之上叠加Information Layer(信息层),能解决一些实际问题。最早的时候,已经有手机AR的雏形出现,手机上通过拍照,呈现数字化内容。但可穿戴和手机这两个载体还是不一样,(我之前做过移动互联网、做过游戏)即使是手机载体的AR,大家看到的也只是屏幕上的信息,所以我认为在AR场景里,“可穿戴”比“手机”更适合。VR是个完全沉浸式设备,且没有完全绑定物理空间;同时,它本身的定位不是那么方便看到外面的世界,即使现在有苹果Vision Pro,有视觉穿透,但是安全感和AR还是比不了。AR的不同之处在于,你眼睛看到的是物理信息,虽然是投影在眼前,但是你好像置身于场景里,这有一定颠覆性,不管是商业化、技术上都有比较大的想象力,你能预判到人类期待这样的交互方式,因为它的确和现实有强关联。这也是为什么我一直没有选择VR赛道,而是只选择纯AR的原因。科技行者:你觉得AR比VR更有前景,是因为它和物理世界联系更紧密,是基于物理世界之上的增益。赵维奇:是的。更重要的是,AR所解决的问题是基于现实世界的,不管是ToB、ToG的解决方案,还是ToC的文娱体验,都没有脱离我们所在的真实世界,让用户和消费者能在现实世界中看到、接触到更多数字化内容和体验。比如文旅场景,现在非常成熟的AR博物馆导览,全国90%的博物馆里都有Rokid的导览眼镜,能让用户在现场看到实物展品的同时,通过AR还能看到展品背后的文物历史、结构拆解、背景故事等。所以,从实用性来说,如果你要做些真正有用的东西,那么AR更接近一些,而且它也有趣,和现实有强关联。Rokid全球开发者生态负责人兼高级产品技术总监赵维奇,试用Rokid第一代产品雏形
科技行者:现在AI的变革很大,ChatGPT出来了以后,有人说AI值得让所有行业重做一遍, AI与AR技术的结合又能出现什么新火花?赵维奇:现在AI更多是基于大模型的AI,AI往后推是“端上的模型”,再往前推是“算法”,其实AI就是算法、就是解决方案。AR在诞生之初其实就与AI强关联。传统的AR眼镜,会带有摄像头,摄像头能识别平面、场景、人,这些本身就是AI的能力。对我们来说,AI与AR从第一天起就是紧密相连的,且一直初心没变,AI离不开AR,AR离不开AI。现在有很多公司想做硬件,是因为AI的能力要在一个载体上去呈现,AI可以处理文字、图像、视频,而眼镜是个天然的能够输入语音、视觉图像、场景信息的载体,按照这个设想,我们做的是另外一个增强的眼睛、嘴、耳朵,它能听到你的诉求、看到你的场景。 赵维奇:对。在这种情况下,让我们碳基生命的能力得到拓展。Rokid的X-Craft产品,主要面向工业场景,赋能普通工人成为“超级工人”,普通工人在高科技方面的知识相对较少,所以AR方式对于他们更人性化。Rokid主打自然交互,像手势交互、语音、视觉交互,这些技能是很容易上手的,不像是手柄有学习门槛,所以工人们很快学会。 同时,这相当于他的大脑有了延伸,因为后面有个团队支撑他解决现场问题。传统需要拿个手机对照现场情况,现在通过视觉第一时间知道状况。这是AR比较好的应用场景之一。 科技行者:能否具体还原一下这个场景,因为大家日常也不太能见到工业的实景。 赵维奇:假如你在前线巡检,荒郊野岭的,环境相对恶劣,尽管有基站有通信,但对于单独巡检的工人来说,通过我们的AR工业头环,当发现问题以后,你可以远程呼叫一个“远程协作专家”,专家在全球任何地方,也能第一时间看到现场情况。另外,很多场景下需要释放双手,当工人求助的时候,它可以标注,比如某个开关出了问题,传统方式还得先拍照,对实时通信要求更高,他也许正在高塔上面,很难再掏出设备来拍照,但如果戴着AR设备,你直接用语音呼叫很方便,这也是现在比较流行的多模态概念,支持文字、视觉、语音输入,来完成当前任务。 刚才说的是ToB的场景,现在还有一些2B2C的场景,也就是B端买单、C端体验,比如博物馆、学校等,也是一样。Rokid主要专注于自然交互场景,在博物馆戴上眼镜所见即所得,一识别就出现内容,门槛相对很低,大众也能接受,这样就能慢慢打开C端的接受程度,大家会发现它的价值,再发展就变成:我们希望人手一个AR眼镜。
科技行者:AR眼镜还会怎么进化?才能实现你说的“人手一个”。 赵维奇:首先,它的形态一定是眼镜,它得能够长时间佩戴,所以对它的配重、舒适度、形态、外形都有要求。Rokid有个秉性,一定是做眼镜的形态,人类对于眼镜的接受度相对高,所以AR眼镜的商业化路程相对更短。其次,未来它的角色是一个交互平台的载体,它会成为一种新的交互方式,我们希望Rokid的产品更多人使用、更多人觉得有用。科技行者:但如果再大胆设想,我个人可能希望未来的人机交互,人类感受不到机器本体的存在,它好像是个隐形的帮手,交互起来更自然。赵维奇:我们也有这一设想,此前有团队做过AR隐形眼镜,这条路线也没有错,AR眼镜的终极状态或许是视网膜,或者通过脑接口直接连接信号到人类的眼神经,那就涉及到要改造人的状态。 在这个过程中,我个人觉得眼镜还是相对接近它的终极形态,如果用头显,距离不是拉近,而是拉远了。所以路径是没有变的,只是说什么时间达成什么阶段,可能短期有短期的目标,长期有长期的终极形态。 科技行者:除了形态之外,还有交互方式,今天体验了Rokid的产品,发现有的产品是用手势“捏”,有的产品是用触摸板“按”,不同的交互方式是怎么考量的? 第一款,你所说的可以“捏”的产品,是Rokid去年发售的AR Studio,采用「单目摄像头+3D手势交互」的方案,是一个空间计算的套装,有个摄像头,算力更强,能处理复杂问题,完全可以用手势操作。AR Studio是面向2B2C的场景,以做项目、落地、重交互为主,比如Rokid做的奥特曼、敦煌、大唐不夜城都是较重的应用,需要更强的算力和更强的交互,它的交互不单单是“捏”,原则上可以识别所有的手势,把每个指关节都能抓取出来,只不过是在实际应用的时候,看哪种手势更适合它所在的场景。
而第二款,通过人们更加熟悉的交互方式,射线以及触摸板,这是我们ROKID今年新发售的新一代的产品Rokid AR Lite,面向C端群体,轻便,随时随地大屏多屏随身屏。观影游戏,办公车载,适合更多日常场景。我们为什么设计成这样?以前很多人不会操作「射线」,很难选中他要选中的地方,但大家都会操作「触摸板」,就类似于PC上的触摸板,如果你对精细度的交互要求更高,就适合这类产品,支持单指、双指操作,可以滑动窗口、选中细节的地方,用起来更得心应手。但是未来你可以期待一下,我们会在ToC产品上增加更多维度,目前主要还是偏向于空间维度,也就是3自由度(DOF),允许你环顾四周,很快我们也会兼容有摄像头的版本,增加更多精细化的交互方式。科技行者:所以区别就在于,“有摄像头的版本”能做很多空间计算和手势识别,“没摄像头的版本”就是原生的外接触摸板体验。 赵维奇:没错,但是“没摄像头的版本”也有非常有场景的3自由度的体验,可以实现3自由度下的交互体验,包括多屏办公,360观影等,接驳各种云服务,可以实现云游戏云办公。 科技行者:所以这两条产品线并不是迭代关系,只是Rokid针对不同场景,给到不同解决方案。 赵维奇:其实最后就是取舍,最有趣的地方是取舍,你要砍掉这个、砍掉那个,垂直场景受众群体少,但是专业能力强,就像我早年创业做的针对极限运动的AR一样。所以我们会在“适合更多的场景”还是“适合比较重要的单一场景”做取舍,这是我们反复要想的事情,最终产品的交互方式、产品的定义,都是在这些取舍的基础上产生的。 科技行者:其实小而美,或者大而泛,是每个创业公司一直要去平衡的事情。赵维奇:没错,不像是大公司,这条路走不通就砍掉这个产品线,不做就行了。而像我们这样的创业公司,试错成本很高,无法动不动就大砍,砍掉的那是生命线。
科技行者:之前我在Unity开发者大会上体验过,发现很多游戏是基于Rokid头显这个硬件去做的。赵维奇:从生态角度来说,我们希望更多人来用产品,在上面创造更多体验;从开发者角度,会希望在Rokid的平台上到底能创造什么样有趣和有用的应用。基于此,我们做过很多线上线下活动,每年都有高校比赛和应用大赛,吸引更多开发者和潜在生态伙伴来玩,看看能挖掘哪些更多的场景和创新。赵维奇:没错,游戏有一种设计叫「心流」,你体验过程中,情感和情绪变化也会不一样,AR有时候就是,如果你体验Rokid的“掌中宝”,悬浮在手心里的小动物,你可以把玩,它可以变很大,但是扔出去,会瞬间恢复原始大小,这种视觉效果会让人“哇哦”。这种感受从别人口中听到,和你自己真正体验到,完全不一样,这也是AR的魅力之一。科技行者:既然说到体验,究竟什么游戏或场景体验比较适合AR?赵维奇:第一,是和物理世界强关联的体验。举个例子,在博物馆看陶罐,它在周边显示信息,甚至是一个古人走出来,这就是很不错的体验,因为它是长在场景上的体验。AR有个神奇之处,大家看的还是物理世界,你有所期待,我给你呈现,你觉得很契合,契合点很重要,虚实融合最难的点就是要和物理世界强关联,关联得越紧密,你就觉得越自然,你的感受也越强烈。这是和VR的最大区别。VR就是尽可能把你与物理世界分割,把你扔到月球上、任何地方,让你忘记现实,而这是另外一种体验,就是让你能够天马行空,去看任何有趣的东西。第二,不仅要和物理世界的场景关联,还要和物理元素绑定在一起。比如我们有个游戏叫“保卫农场”,会有怪物跑出来,需要拍打阻止怪物,它的设计是,你要找到真实的一块桌面,人用手去拍桌面,它是有真实反馈的,它给你的痛感和激烈程度,比如你激动的时候会狂拍桌,和你在空气中拍的感受完全不一样,玩家的体验更好。再比如,有团队做过一个游戏,让你手上拿一个道具,就会长出剑等,但是如果你没有真的握住道具,感受完全不一样。第三,如果你想做得好,任何时间、任何场所,你都能体验。像Rokid AR Lite上的应用,比如棋牌和卡牌,随时随地,把一个迷你世界带在身边,那是你自己的私人空间,有别于传统的私人空间书房、阁楼、车等。第四,安全感。当你戴上头显,你的安全感是丧失的,或者被交付的,你是交给设备的,当设备出现任何问题,你的安全感一下就丧失,比如它有延迟、甚至突然黑屏,这时候会打破你之前所有美好的体验印象。但是AR是通过OST(光学透视技术,Optical See-Through Technology)体验,OST最大的好处是能看到物理世界,所以AR有天生的给你安全感的部分。在这基础上,Rokid比较擅长的部分:第一,外面看不到里面,隐私可以保护到;第二,声音是定向输出,只有体验者能听到,所以进一步符合私人世界的理念。科技行者:可能又有很多人想进到AR游戏的圈子。在AR眼镜上,设计游戏交互体验,具体有哪些挑战?赵维奇:挑战有很多。第一,是AR眼镜自身的挑战:视野,你的可视范围很有限,所以你要做很多过渡,或者让边界感变得弱一些,减少边界感,管理好兴趣点。第二个挑战在于,我们交互方式有很多,你用语音、手势、物理键盘、滑鼠、触摸板,这些交互方式在你真正应用场景下,选择哪个,用什么方式最合适,也是挑战。第三,设备本身的挑战,对于任何一个可穿戴设备来说,电池、续航都是要考虑的。所以无论是从开发者角度,还是从APP产品设计、游戏设计的角度,你要让你的算力要求、渲染要求更低、功耗更低,这样可以确保它的续航。第四,如果要落地到全球化,它的挑战还和本地语言、法律法规、场景、生活习惯都强相关,因为它相对可以覆盖更多人群,不同人群对于AR体验的期待和场景需求完全不同。第五,是操作系统的适配。我们的系统还支持桌面应用、Web应用等多个生态应用,对于游戏开发者、商业化开发者,选择什么赛道,面向什么人群,提供什么样的体验,这3个问题是他在任何时候都要思考的,比起手机,AR更多样化,它相当于一个体验设备,不单单是信息终端。
科技行者:你在Rokid负责全球开发者生态,你认为AR游戏产业生态有哪些不同角色,各自发挥什么作用?赵维奇:首先是「开发者或创作者」,然后是像Rokid这样的「软硬件平台供应商」,还有「运营方」,最后最重要的生态核心是「用户」,这几块天然地绑在一起。对开发者来说,做的是一个技术活,或者是一个设计活,只要在这个设备上提供比较好的体验,他的角色就完成了。软硬件平台供应商要做的是,让用户愿意持续佩戴,轻松体验开发者开发的应用,这是我们要做的事,让用户快速触达到它们。运营方的工作,有一部分在我们自己,有一部分是和第三方合作。我们在海外3C的主机是谷歌的生态,它能连接 Google Play,因为生态很大,所以更需要我们给出建议,诸如什么样的应用在这个场景下更适合,这也是我们始终思考的点。因为现在有些平台,做的只是移植,比如某个VR把原来平板的平台移过来,是否适合自己,是否适合自己,还需要反复测试与迭代。不过,对于生态的各方来说,要做的是筛选适合该场景的应用,让它更多曝光在潜在目标用户眼前,所以这一切,刚才说的那3个角色,最终都是为了用户。所以生态最重要的是用户。科技行者:但是根据技术采纳度曲线,用户也需要一个适应的过程。赵维奇:没错,用户对于一个新形态的设备,需要一个教育市场的阶段和过程。首先,需要培养用户基础。我们有条路线是2B2C,会去线下办展,博物馆里也有,目的是让更多用户,通过各种渠道,去了解或体验产品,他前期不一定要买回家,但是在某个地方已经体验过,下次自己就有概念了。其次,需要为用户服务。当用户相对成熟以后,我们就有目标。比如Rokid的ToC产品是慢慢往上堆,一开始是观影、云游戏、办公,慢慢扩展到有一个私人空间,相当于第一波用户已经被教育过了,它熟悉了这个场景以后,他开始需要更多场景或品类,我们会传达给更多开发者和创造者,像Unity这样的公司就会提供更好的引擎,来帮助开发者完成这件事。这也是为什么我们和很多像教育、文旅合作,是因为教育和文旅触达的是最大众的市场,他们对自己的需求也更明确,他想玩游戏、想放松、想办公,这部分诉求也会更快反应到生态,我们作为生态,可以反馈到开发者、创作者,开发不同的体验和产品给到用户,这是一个供给的过程。这条链路,任何生态都一样,总的来说就是为现在和未来的用户服务。 科技行者:作为全球开发者的负责人,你觉得怎样运营好开发者生态,或者可以通过运营好用户,来反馈到开发者生态?赵维奇:对于我们的开发者,我们会持续提供各种工具与服务,为他们创造开发环境。第二,Rokid在全国开展“漂流计划”,提供样机给那些想要开发但还没有设备的开发者,通过借用的方式用2-3周,这些设备就在开发者中间流转,除了设备流转,人也有流转,有社交和信息共享,以亲身经历分享体验与感受,这样也相当于活跃了整个开发者生态。第三,Rokid有“高校计划”,今年已经是第三届。无论是学校或学生自己,如果是数字媒体、计算机、艺术等专业,都想通过AR这一媒介做些什么,我们持续与学校、老师、学院合作,落地一些课程,帮助他们去更多了解AR,潜在培养了新进开发者。 赵维奇:是的,目前我们第一期的20多台产品已经收回。要想做好开发者生态,第一要“用爱发电”,告诉大家我们拥抱大家来玩、来体验,多听大家的声音,这是社区和生态的初衷,就好比在整个森林里,小动物互相帮助,短期内看不到直接利益,但是长期会更加信赖你这个森林,更加信赖社区,信赖你们的方向,也是我们一直在做的点。第二,开发者如果想在上面创造什么,我们给你支持,我们每一年的年中有高校挑战赛,年底有全球应用开发大赛,会出来非常多应用,也孵化出很多公司。对于整个大生态来说,我们就是帮助大家更多投身在AR行业里,这是我们的初心,只有大家好了,我们才能更好。 科技行者:说到Unity,Rokid和Unity的合作是怎么开始的?赵维奇:Rokid和Unity一直是很好的合作伙伴。原因是,第一,Rokid大多数开发者,都是用Unity引擎开发的,做游戏的很多都用Unity。第二,在AR方面,我们自己的很多开发者工具、套件,都是和Unity的小伙伴一起优化的结果。所以Unity更适合在我们的轻量化,相对低的算力的设备上,能够跑较高质量的渲染结果和体验,这是我们共创的部分。第三,过去几年里,不管是开发者沙龙、比赛、技术交流,我们和Unity一直强绑定。Unity的原生开发者做2D、3D,也希望寻求更多平台,发挥他的才智,所以Rokid是Unity最大的落地点之一;而对于开发者来说,工具很重要,Unity是目前相对稳定、且有效的开发工具。科技行者:最后再问一个公司之外的产业问题,如何看待苹果Vision Pro这个产品?赵维奇:它是非常好的产品,不管是从用户体验,还是产品定义上,它呈现的绝对是前所未有的体验感,苹果的确在应用上和硬件上做足了的功夫。另外,Vision Pro也打开了新局面,让更多受众了解AR,如果往长远看,我个人觉得这是两个不同赛道,我们是做glasses(眼镜),Apple Vision Pro是Headset(头显)。所以在硬件没有一个质的飞跃突破之前,两个会并存一段时间,我们也会各自根据各自的场景提供不同的解决方案。 科技行者:从专业的角度看,你觉得苹果Vision Pro还有哪些点可以改善?赵维奇:如果是一个ToC产品,首先,可用、好用、可触达都是需要解决的问题,可触达是指用户买得起,这是最重要的一点。因为任何新生产品,早期的受众都是先锋开发者,他会是体验者,对价格不敏感,他的容忍度很高,但是这个阶段到底有多长?经过这个阶段,跳到下个阶段,到底是什么形态?可能是比较大的挑战,到底我们能给真正用户,或者给体验者什么样的ToC的价值,那可能是需要考量的地方。第二,场景。除了价格以外,我们到底用它来干什么?市面上有没有其他平替的方案?不过这方面,用户自然会去评判。第三,性价比。可穿戴的重点是舒适度,能维持更长时间,用户才会再次佩戴,为什么苹果Vision Pro出现了很多周边公司和产品,是为了帮助它能够更好佩戴,当一个可穿戴设备佩戴不舒服,体验感就会大打折扣。第四,人群。任何可穿戴设备,都属于大众商品,你要确保这个产品,能覆盖更多人群。如果是女性用户,头显就不太友好,因为当她戴上头显后,妆容被影响,发型也受影响。而我们选择AR眼镜,相对适配性更高,不会有强烈的异物感,但缺点是可视角没那么大。所以需要做出一些取舍,不过有时候,有局限也不一定是坏事。· FIN ·
科技行者团队出品
蚂蚁数科CEO赵闻飙首次解读新战略:布局“ABC”,加码技术出海
AI大模型来了,还需要学校和老师吗?